Introdução: O presente estudo integra um projeto de Iniciação Científica que busca compreender as desigualdades educacionais no Brasil, com foco na relação entre a renda familiar, a localidade e o desempenho dos estudantes no Exame Nacional do Ensino Médio (ENEM). Considerando a importância do ENEM como mecanismo de acesso ao ensino superior e os contrastes socioeconômicos entre as regiões brasileiras, o trabalho propõe investigar como esses fatores influenciam o rendimento estudantil. Para isso, será realizada uma análise de dados com apoio de modelos de inteligência artificial, visando identificar pontos críticos de influência no desempenho e contribuir com evidências para a formulação de políticas públicas educacionais. A base de dados utilizada para esta análise é proveniente dos microdados do ENEM, disponibilizados pelo INEP por meio do portal de dados abertos: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/enem. Como etapa preliminar da investigação, foi elaborada uma matriz de correlação entre variáveis socioeconômicas e as notas dos participantes, com o intuito de explorar possíveis relações estatísticas relevantes. Objetivo: Analisar a correlação entre a renda per capita familiar e o desempenho dos estudantes no ENEM 2023, observando as variações dessa relação entre as diferentes regiões do Brasil por intermédio de modelos de inteligência artificial. Metodologia: Tipo de estudo: Estudo descritivo, com abordagem quantitativa. Período: março a maio de 2025. Etapas: (i) Coleta dos dados (Obtenção da base de dados do ENEM 2023 disponibilizada pelo) INEP. (ii) Limpeza e tratamento dos dados (Remoção de registros com valores nulos ou inconsistentes; Exclusão de colunas irrelevantes para o objetivo do estudo; Padronização de formatos. (iii) Análise exploratória (Elaboração de uma matriz e gráfico de correlação entre variáveis socioeconômicas e notas dos participantes; A partir dessa análise, observou-se que as variáveis Q006 - renda familiar e Q024 - posse de acesso à internet em casa apresentaram as correlações mais significativas com o desempenho dos estudantes, indicando sua relevância no modelo preditivo). (iv) Complementação da base de dados (Inserção do Índice de Desenvolvimento Humano (IDH) correspondente ao estado de cada participante; Identificação se o participante reside em zona rural ou urbana, com base em informações de município e localidade). (v) Equalização das bases (Balanceamento das variáveis para evitar viés no modelo; Normalização ou padronização dos dados numéricos (como renda e notas). (vi) Treinamento do modelo de IA (Escolha e aplicação de algoritmos de regressão para prever as notas dos estudantes com base nos dados tratados; Divisão entre conjunto de treino e teste para avaliação de desempenho do modelo). (vii) Análise dos resultados (Verificação dos fatores com maior influência nas previsões; Interpretação dos padrões encontrados a partir das variáveis socioeconômicas e regionais). Sujeitos envolvidos: Estudantes inscritos no ENEM 2023 com dados válidos sobre rendimento e informações socioeconômicas. Materiais: Utilizou-se a base de microdados do ENEM 2023 disponibilizada no site do GOV.BR. As análises foram realizadas com o uso da linguagem Python, com apoio das bibliotecas Pandas, NumPy e Seaborn. Resultados parciais e Discussão: Até o momento, a equipe concentrou esforços nas etapas iniciais do projeto, realizando o levantamento e a organização da base de dados do ENEM 2023. Foi possível identificar a complexidade e o volume dos dados, o que exigiu um trabalho minucioso de filtragem e limpeza, removendo registros incompletos ou inconsistentes. Também foi iniciada a integração de informações externas, como o IDH dos estados e a classificação das localidades como zonas urbanas ou rurais. A partir dessa experiência, observamos a importância de uma preparação rigorosa dos dados para garantir a qualidade das análises e a eficácia do modelo de IA que será treinado posteriormente. A equipe destaca, ainda, o desenvolvimento de habilidades técnicas e analíticas como parte relevante do processo de pesquisa. Considerações finais: O projeto, ainda em fase de desenvolvimento, possibilitou a coleta e o tratamento dos dados do ENEM 2023, além da integração de informações socioeconômicas e regionais, como o IDH e a classificação urbana/rural. Também foi iniciada a análise desses dados, utilizando métodos como a matriz de correlação para verificar quais variáveis exercem maior influência sobre o desempenho dos candidatos. Como contribuição, destaca-se o desenvolvimento de uma base consolidada que permitirá análises mais precisas sobre desigualdades educacionais, bem como de um modelo capaz de prever a nota do candidato com base em dados socioeconômicos e de localidade. A experiência também proporcionou o aprimoramento de habilidades técnicas da equipe, como a análise minuciosa de dados e a construção de modelos preditivos. Como limitação, observa-se a complexidade e o tempo necessário para preparar e equilibrar os dados antes do treinamento do modelo de IA, o que pode impactar o cronograma previsto.
A II Jornada Científica do PROMIC 2025 é uma iniciativa promovida pela Coordenadoria de Pesquisa e Monitoria (COOPEM) da Unifametro, com o objetivo de fomentar a divulgação e o acompanhamento do progresso dos projetos desenvolvidos no âmbito do Programa de Monitoria e Iniciação Científica (PROMIC).
Este evento celebra a dedicação de alunos e professores na construção do conhecimento científico, proporcionando um espaço para o intercâmbio de ideias, a reflexão crítica e o incentivo à produção acadêmica de excelência. Por meio da apresentação de resultados parciais e finais das pesquisas, a Jornada busca não apenas estimular o aprendizado interdisciplinar e o pensamento inovador, mas também reforçar o compromisso da Unifametro com a formação integral de seus discentes.
Convidamos todos a explorar os anais deste evento, que representam um marco significativo na trajetória acadêmica e científica da instituição, evidenciando o papel transformador da pesquisa na construção de uma sociedade mais justa e sustentável.
Normas para Submissão de Resumos Simples
Os resumos a serem submetidos à II Jornada Científica do PROMIC 2025 devem ser elaborados e formatados de acordo com as seguintes diretrizes:
Título
Autores
Informações adicionais
Classificações
Corpo do Resumo
Palavras-chave
Referências
Essas normas visam padronizar os trabalhos apresentados, garantindo a qualidade e a organização dos anais da II Jornada Científica do PROMIC 2025.
Comissão Organizadora
Gabriella de Assis Wanderley
Antônio Adriano da Rocha Nogueira
Kauã Alexsander Gomes Carvalho
Comissão Científica
Antônio Adriano da Rocha Nogueira
Kauã Alexsander Gomes Carvalho
A Comissão Científica permanece à disposição pelo e-mail coopem@unifametro.edu.br e presencialmente na sala da Coordenadoria de Pesquisa e Monitoria (COOPEM) localizada no Campus Carneiro da Cunha do Centro Universitário Fametro - Unifametro.